查看原文
其他

Python开源BI工具Superset的简单搭建与初级使用

道才 可以叫我才哥 2021-10-15


Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard(看板),为数据分析提供了轻量级的数据查询与可视化方案。


06

目录:

  • 1.搭建流程

    • 1.1.构建虚拟环境

    • 1.2.激活虚拟环境

    • 1.3.安装superset

    • 1.4.初始化superset

    • 1.5.superset启动脚本

  • 2.使用流程

    • 2.1.数据源设置

    • 2.2.上传csv文件

    • 2.3.图表

    • 2.4.看板

官方网站:http://superset.apache.org/

Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard(看板),为数据分析提供了轻量级的数据查询与可视化方案。

主要功能及特点
(为啥是英文的,因为我不知道怎么翻译的好,反正能看懂就行)


主要功能

官方看板示例

1.搭建流程

我的本机环境如下:

# 系统版本:Windows10家庭版
# Python:python 3.7.7
# Superset:0.36.0

1.1.构建虚拟环境

当然,不构建虚拟环境也是可以搭建的,这里构建虚拟环境可以相对保证咱们只需要用到Superset的依赖库,纯净。这里我们简单介绍2中构建虚拟环境的方式,其中一种是通过Anconada navigator直接创建,另外一种是在命令行通过命令创建,大家可以根据自己的实际情况进行选择尝试。

方式一 Anconada navigator
如果你是安装的Anconada,可以直接打开 Anconada navigator,通过以下示例图方式创建虚拟环境supersetTest (名字可以自定义)
方式二 命令行
如果你安装的是Anconada,通过以下命令即可创建一个名为“supersetTest”的虚拟环境。

conda create -n supersetTest python=3.7.7

如果是直接安装的python官方环境,可以先安装一个用于创建虚拟环境的第三方库virtualenv,然后再进行虚拟环境构建。

# 安装第三方库
pip install virtualenv
# 创建一个名为supersetTest且不拷贝系统的python第三方库的虚拟环境
virtualenv --no-site-packages supersetTest
# 激活该虚拟环境
supersetTest\Scripts\activate.bat
# 退出该虚拟环境
supersetTest\Scripts\deactivate.bat

1.2.激活虚拟环境

通过上述方式一,我们构建了虚拟环境 supersetTest,由于安装superset关联的第三方库较多,我们激活该虚拟环境后再进行superset的安装。

# 激活虚拟环境,后续在该环境下安装相关库
activate supersetTest

1.3.安装superset

在之前就行安装的时候,遇到很多问题,当然最后都解决了,所以这里直接以最终解决后总结的安装步骤进行介绍(注意:需要安装在上一步构建的虚拟环境中)。

第一步:升级setuptools和pip;

# Put all the chances on your side by getting the very latest pip and setuptools libraries.:
pip install --upgrade setuptools pip

第二步本地安装以下两个库;

python_geohash-0.8.5-cp37-cp37m-win_amd64.whl
sasl-0.2.1-cp37-cp37m-win_amd64.whl

https://www.lfd.uci.edu/~gohlke/pythonlibs进行以上两个轮子的下载(大家根据自己的环境进行版本选择),然后本地安装,安装过程中一定要注意 被安装文件路径写全。

pip install C:\Users\Gdc\Downloads\sasl-0.2.1-cp37-cp37m-win_amd64.whl
pip install C:\Users\Gdc\Downloads\python_geohash-0.8.5-cp37-cp37m-win_amd64.whl

第三步:安装superset。
完成第一步的安装后,再进行本步骤,一般是很可以很顺利完成安装的,否则可能会出现很多报错(基本都是依赖关系库版本匹配问题等)

pip install apache-superset==0.36.0

1.4.初始化superset

直接拷贝官网初始化流程如下:

# Initialize the database
superset db upgrade

# Create an admin user (you will be prompted to set a username, first and last name before setting a password)
export FLASK_APP=superset
superset fab create-admin

# Load some data to play with
superset load_examples

# Create default roles and permissions
superset init

# To start a development web server on port 8088, use -p to bind to another port
superset run -p 8088 --with-threads --reload --debugger

不过,这些命令需要在superset安装路径下使用,比如我的是这样:

C:\Users\Gdc\anaconda3\envs\supersetTest\Lib\site-packages\superset\bin

按照流程进行执行即可,每一步之前记得加上 python,部分步骤如:

python superset db upgrade【数据库初始化】

初始化数据库

python superset fab create-admin【创建账号】

创建账号

python superset run -p 8088 --with-threads --reload --debugger【启动superset】

启动superset

1.5.superset启动脚本

为了快捷启动superset,我们可以编写简单的脚本bat文件

call cd C:\Users\Gdc\anaconda3\envs\supersetTest\Lib\site-packages\superset\bin
call activate supersetTest
call python superset run -p 8088 --with-threads --reload --debugger

pause

2.使用流程

当我们启动superset之后,在按照提示在浏览器输入“http://127.0.0.1:8088/”即可进行访问,在右侧可以选择页面语言(我这里选择的是中文)。

superset

2.1.数据源设置

数据源设置里我们可以设置数据库,superset支持很多数据库,具体大家在官网即可查阅。这里我使用的是mysql,因此可以在数据源中新增mysql数据源,参考如下:

mysql://root:password@localhost/databasename?charset=utf8
添加数据库

2.2.上传csv文件

除了直接从数据库获取数据外,如果源数据是csv文件,也可以通过上传csv文件(其实是写入了你关联的数据库里)

上传csv文件

2.3.图表

提供很多可视化图表,大家可以根据自己的需求进行数据字段的拖拽,然后创建需要的图表形式。

图表

2.4.看板

多个图表可以组成看板,看板页面也可以自己拖拽图表创建你喜欢的看板形式。

看板


往期推荐



 默默关注才哥

然后惊艳所有人

可以叫我才哥



                 我就知道你在看!
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存